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摘要 : (本 文 是 在 学 完 《 深 度 学 习 课程 》 后 ， 对 深度 学 习 有 一 定 了 解 后 写 的 一 篇 深度 学 习 结 合 故 
障 诊断 应 用 的 的 一 篇 综述 ， 如 有 不 足 之 处 请 老师 批评 指正 )。 近 年 来 工业 过 程 向 过 程 复杂 化 、 规 模 大 型 化 
的 方向 发 展 ， 传 统 的 故障 诊断 技术 已 在 解决 实际 工业 过 程 问 题 时 ， 遇 到 了 一 系列 难题 。 随 着 深度 学 习 (deep 
learning) 在 特征 提取 与 模式 识别 上 的 优异 性 能 和 独特 潜力 ， 深 度 学 习 技术 被 用 于 故障 诊断 已 经 成 为 当前 研究 
的 重点 。 为 此 本 文 介绍 了 几 种 典型 的 基于 深度 学 习 的 故障 诊断 方法 。 最 后 对 于 深度 学 习 在 故障 诊断 应 用 中 存在 
的 障碍 进行 了 探讨 ， 并 对 展望 了 未 来 的 相关 研究 方向 。 
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Abstract: In recent years, the industrial process has been developing towards complexity and 
large-scale, which has posed a series of challenges for traditional fault diagnosis techniques to 
solve practical industrial process problems. With the superior performance and unique potential of 
deep learning in feature extraction and pattern recognition, the application of deep learning 
technology to fault diagnosis has become a current research focus. Therefore, this article introduces 
several typical fault diagnosis methods based on deep learning. Finally, the obstacles in the 
application of deep learning to fault diagnosis are discussed, and the future research directions 


are prospected. 
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随 着 计算 机 技术 、 通 信 技 术 和 传 感 技术 的 飞速 发 。 程 数 据 进 行 监控 ,来 判定 系统 是 否 发 生 故障 ， 同 时 这 
展 ， 现 代 工 业 过 程 呈现 复杂 化 、 集 成 化 、 规 模 化 的 新 ” 对 故障 发 生 的 位 置 和 种 类 进行 定位 和 区 分 。 然 而 ， 现 
发 展 趋势 ， 系 统 过 程 数 据 呈 现 海量 化 ， 低 价值 化 , 不 代 工 业 过 程 的 复杂 性 和 大 规模 集成 化 , 许多 组 件 之 间 
平衡 化 的 发 展 趋势 。 传 统 的 基于 数据 驱动 的 故障 诊断 ”存在 复杂 的 依赖 关系 ， 使 得 过 程 数 据 呈 现 非 线性 、 不 
方法 不 适应 这 种 新 的 数据 类 型 。 同 时 工业 过 程 的 集成 ”确定 性 关系 。 传 统 的 针对 单个 组 件 和 单元 的 故障 诊断 
化 ， 也 造成 了 工作 单元 之 间 的 相互 耦合 ， 在 成 系统 呈 方法 难以 提取 和 利用 这 种 非 线性 关系 ,因此 它 的 误诊 
现 出 了 非 线性 特性 和 不 确定 性 。 传统 的 建 模 方 法 无 法 ” 率 和 漏 报 率 都 很 大 。 

有 效 处 理 这 种 复杂 情况 。 近年 来 ， 深度 学 习 在 学 术 界 和 工业 界 发 展 迅 猛 ， 

一 般 来 说 ， 故 障 指 的 是 是 系统 中 单个 变量 或 者 多 ”在 很 多 传统 的 识别 任务 上 显著 地 提高 了 识别 准确 率 ， 
个 变量 发 生 既 定 轨迹 的 偏离 ， 进而 给 产品 质量 或 者 系 ”彰显 了 其 高 超 的 处 理 复 杂 识 别 任务 的 能 力 ,， 吸引 了 大 
统 性 能 带 来 严重 影响 。 故 障 检测 与 诊断 技术 就 是 对 过 — 批 专 家 学 者 对 其 理论 与 应 用 展开 研究 "“。 当 前 很 多 学 


都 开始 尝试 应 
题 。 

深度 学 习 是 以 神经 网 络 为 基础 发 展 起 来 的 一 种 
网 络 模型 ， 它 的 特点 是 网 络 中 包含 多 个 隐藏 层 。 相 比 
较 于 一 般 的 神经 网 络 模型 ,深度 学 习 中 的 深度 指 的 是 
网 络 学 习 得 到 的 非 线 性 运算 组 合 水 平 的 数量 ,也 就 是 
网 络 隐 含 层 的 数量 。 深 度 学 习 拥有 更 多 的 隐 含 层 数 ， 
因此 拥有 更 好 的 逼近 复杂 函数 的 能 力 , 在 面 对 非 线性 
数据 时 具有 更 好 的 特征 提取 能 力 。 

深度 学 习 经 过 多 年 的 发 展 , 已 经 取得 了 很 多 成 就 ， 
在 复杂 函数 的 表达 地 方面 有 着 无 可 比拟 的 优势 。 本 文 
在 总 结 近 几 年 来 国内 外 深度 学 习 在 故障 诊断 上 的 应 
用 的 基础 上 , 探讨 了 现代 复杂 工业 过 程 故 障 诊断 中 新 
的 问题 和 挑战 , 展望 基于 深度 学 习 的 故障 诊断 方法 在 
未 来 的 发 展 前 景 。 


深度 学 习 理 论 来 解决 各 自 领 域 的 
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1 深度 学 习 在 故障 诊断 的 研究 


深度 学 习 的 主要 作用 就 是 提取 数据 间 的 有 效 特 
征 ， 发 现 是 举荐 的 内 在 结构 和 本 质 关 系 。 数 据 的 表示 
方法 对 于 模型 的 最 终 效 果 至 关 重 要 。 好 的 数据 表示 方 
法 能 够 保留 数据 中 心 与 任务 相关 的 信息 ， 消 除 掉 不 必 
要 的 干扰 和 噪声 ， 从 而 提高 模型 的 性 能 。 

近 几 年 来 , 得 到 广泛 应 用 的 几 种 模型 包括 深度 置 
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图 一 : DBN 的 模型 结构 

DBN 的 训练 方法 采用 了 贪 焚 预 训练 方法 , 首先 使 用 
无 监督 学 习 算 法 逐 层 的 训练 网 络 ， 控 掘 数据 中 的 特征 信 
息 ， 然 后 连接 相应 的 分 类 器 通过 监督 学 习 的 方式 实现 对 
网 络 中 参数 的 微调 ， 来 优化 DBN 网 络 对 于 故障 分 类 的 
能 力 。 其 关键 的 特征 提取 能 力 的 实现 是 通过 无 监督 的 逐 
层 训练 实现 的 ， 在 逐 层 的 信息 传递 过 程 中 ， 原 始 的 信息 
得 到 了 抽象 的 特征 表示 。 
基于 DBN 的 特征 提取 技术 与 传统 的 人 工 特征 提取 
技术 相 比 ， 减 少 了 由 于 人 为 操作 的 不 确定 性 ， 使 得 故障 
诊断 过 程 智能 化 。 此 外 基于 DBN 的 特征 提取 技术 摆脱 
了 传统 方法 需要 对 数据 进行 大 量 信号 处 理 和 经 验 筛 选 
的 依赖 ， 实 现 故 障 特征 提取 的 智能 化 。 最 后 是 其 具有 处 
理 高 维度 非 线 性 数据 的 能 力 ， 可 以 有 效 避 免 模 型 诊断 外 
力 不 足 的 问题 人 %。 基 于 上 述 的 优点 ，DBN 模型 非常 适应 
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信和 网络 (DBN)， 堆 栈 自 编 码 器 (SAE)， 卷 积 神经 网 
络 (CNN)， 递 归 神 经 网 络 (RNN )。 为 了 更 加 清楚 地 
阐述 深度 学 习 在 故障 诊断 中 的 应 用 ， 本 文 介绍 了 基于 
上 面 四 种 方法 的 故障 诊断 技术 的 原理 和 方法 ,以 及 相 
关 研 究 。 但 是 基于 DBN 的 故障 诊断 方面 的 研究 还 比 
较 少 。 


1.1 深度 置信 网 络 在 故障 诊断 中 的 应 用 


DBN 是 一 种 经 典 的 深度 学 习 模 型 , 它 可 以 通过 多 层 
玻 尔 兹 曼 机 逐 层 的 提取 出 数据 的 特征 信息 ， 最 终 形成 更 
加 抽象 的 高 层 表 示 。 这 种 方法 模拟 了 人 类 大 脑 的 神经 连 
接 ， 在 训练 数据 集 有 限 的 情况 下 能 提取 出 数据 的 本 质 特 
1E”. 

DBN 是 有 多 个 玻 尔 效 曼 机 (CRBM ) 组 合 而 成 的 深度 
神经 网 络 模型 ， 如 图 一 是 DBN 的 结构 模型 。 


于 目前 新 时 期 工业 “大 数据 ”的 故障 诊断 难题 。 

目前 DBN 模型 在 信号 处 理 方面 和 得 到 了 广泛 的 应 
用 ， 在 语音 和 音频 方面 基于 DBN 的 语音 识别 技术 
DBN-HMM 模型 实现 了 具有 竞争 力 的 手机 识别 精度 , 卷 
R DBN， 它 已 应 用 于 音频 和 语音 数据 ， 用 于 许多 任务 ， 
包括 音乐 艺术 家 和 流派 分 类 、 说 话 人 识别 、 说 话 人 性 别 
分 类 和 电话 分 类 ， 并 取得 了 很 好 的 结果 ， 其 在 图 像 和 视 
频 、 语 言 处 理 和 信息 检索 方面 也 得 到 了 广泛 的 应 用 。 

Shao 5&9. Wang 等 ” 和 Chen 等 " 均 采 用 DBN SE 
现 了 滚动 轴承 和 具 轮 箱 的 故障 诊断 ， 并 与 现 有 一 些 主流 
故障 诊断 算法 进行 了 比较 ， 验 证 了 所 提出 方法 实现 故障 
诊断 的 鲁 棒 性 和 精确 性 。 随 后 ,Li SETS 紧 跟 前 人 的 研究 ， 
继续 在 基于 DBN 实现 高 维 数据 的 异常 检测 与 识别 、 滚 
动 轴承 故障 诊断 、 具 轮 箱 深度 故障 特征 提取 与 识别 以 及 
高 背景 噪声 信息 提取 与 融合 等 领域 展开 研究 ， 均 取得 了 
传统 方法 无 法 比拟 的 效果 与 优势 。Lei 等 "人 提出 了 一 种 
基于 注意 力 机 制 多 尺度 DBN 模型 ， 进 一 步 提升 了 DBN 
模型 在 轴承 故障 中 的 有 效 性 。Wang 等 四 人 为 了 提高 
DBN 模型 的 故障 分 类 能 力 提 出 了 一 种 扩展 深度 置信 网 
络 (EDBN) 来 充分 利用 原始 数据 中 的 有 用 信息 。 将 其 
应 用 于 田纳西 州 伊 士 曼 (TE) 过 程 进 行 故障 分 类 ， 结 果 
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表明 ，EDBN 比 传统 DBN 具有 更 好 的 特征 提取 和 故障 
分 类 性 能 。Wei 等 叫 提 出 一 种 基于 DBN-dropout 的 非 线 
s 诊断 与 辨识 方法 ， 减 少 DBN 模型 过 拟 合 ， 
提高 模型 的 泛 化 能 力 。Tian 等 [2] 针对 在 使 用 深度 神经 
网 络 的 高 维 数据 识别 中 ， 经 常会 遇 到 数据 不 足 和 数据 缺 
失 、 测 量 噪声 、 宛 余 变量 、 数 据 耦 合 度 高 等 问题 提出 了 
一 种 基于 特征 的 DBN 方法 在 TE 过 程 中 的 应 用 表明 ， 
与 传统 的 故障 识别 算法 相 比 ， 该 方案 在 识别 化 学 过 程 异 
常情 况 方 面具 有 快速 收敛 和 高 精度 。 随 着 DBN 模型 的 


发 展 ， 


其 应 用 领 


页 域 从 感 器 健康 诊断 到 压缩 机 、 齿 轮 箱 、 


“等 越 来 越 宽泛 ,但 是 在 过 程 故 


滚动 轴承 


障 诊 断 中 的 研究 


较 少 ， 


在 这 个 方面 共有 较 大 的 本 


Tf 究 空间 。 


基于 DBN 的 故 


障 诊断 方法 可 


以 大 致 分 为 以 下 几 个 
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1.2 堆栈 
堆栈 


通过 传感器 获取 系统 的 过 程 数据 ， 并 对 数 
据 进 行 归 一 化 、 降 噪 等 预 处 理 过 程 。 
将 采集 到 的 信号 进行 分 批 次 划分 ， 并 且 分 
为 训练 集 数据 和 测试 集 数 据 

根据 输入 信号 的 形式 确定 DBN 模型 的 输入 
节点 个 数 ， 然 后 建立 一 个 多 隐 层 的 DBN 模 
型 。 
通过 贪 禁 预 训练 方法 逐 层 对 网 络 参数 进行 
调整 ， 然 后 接 入 对 应 的 分 类 器 对 网 络 参数 
进行 微调 。 

最 后 通过 测试 集 数 据 验 证 网 络 的 有 效 性 。 


自 编码 器 在 故障 诊断 中 的 应 用 
自 编码 器 〈SAE) 能 有 效 提取 出 原始 数据 的 特 


多 个 自 编码 器 CAEO 堆 锥 而 成 的 一 种 深度 学 
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习 模 型 。 


自 编码 器 包括 编码 器 和 解码 器 ， 如 图 二 所 示 。 


其 目的 是 通过 寻找 
解码 后 的 输出 


是 将 多 个 


组 最 优 的 参数 CW, b) 使 得 编码 
y 尽 可 能 的 重 构 输 入 x。 堆 栈 自 编码 器 就 
自 编码 器 的 编码 器 串联 起 来 ， 组 成 的 深度 学 习 


模型 ， 如 图 三 所 示 。 
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: 自 编码 器 结构 
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图 三 :堆栈 自 编码 器 结构 " 
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其 中 W ,b 是 网 络 中 的 权重 系数 和 偏 置 ，m 
代表 了 样本 个 数 ，n , 代表 了 自 编码 器 的 层 数 ， 


代表 了 第 1 — 层 的 节点 个 数 。 式 子 (1) 的 第 一 项 


叫做 重 构 损失 项 ， 用 于 强化 模型 的 特征 提取 能 力 ; SX 
的 第 三 项 叫做 权 值 衰减 约束 项 ， 用 于 增强 自 编 码 器 的 鲁 
Fett. 

自 编码 器 模型 的 训练 仍然 采用 梯度 下 降 法 进行 ， 是 
目标 损失 函数 达到 最 小 化 ,SAE 的 训练 同 DBN 网 络 一 样 ， 
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采用 贪 焚 预 训练 法 进行 模型 的 训练 。 在 预 训练 阶段 ， 单 
独 训练 每 一 个 AE 模型 。 当 低层 的 模型 单独 训练 好 之 后 ， 
其 编码 器 的 输出 作为 下 一 层 AE 模型 的 输入 ， 然 后 单独 
训练 下 一 层 编 码 器 。 各 层 AE 模型 训练 好 以 后 ， 仅 将 AE 
模型 的 编码 其 部 分 保留 起 来 串联 形成 堆栈 自 编码 器 的 
预 模型 。 在 全 局 微调 阶段 ， 以 数据 的 标签 作为 监督 信号 
计算 网 络 的 误差 ， 并 根据 反 向 传播 算法 减 小 误差 来 调节 
预 训练 模型 中 的 参数 。 堆 释 自 动 编 SAE 是 将 若干 AE 
级 联 构建 多 层 神经 网 络 ,其 输出 可 看 作 是 输入 数据 经 过 
多 次 降 维 后 的 特征 表示 ™ 

近年 来 ，SAE 算法 因为 其 优异 的 特征 提取 能 力 得 到 


向 量 机 (SVM) 进 行 对 比 ,结果 表明 该 方法 在 滚动 轴承 故障 
诊断 方面 更 具 优 越 性 。Sun"" 则 展示 了 利用 基于 深度 神 
经 网 络 方法 的 稀疏 自 编码 算法 实现 异步 电机 故障 分 类 
问题 ,其 采用 具有 无 监督 特征 提取 优势 的 稀疏 自 编 码 模 
型 来 学 习 故 障 特征 ,在 降 噪 编码 的 作用 下 有 效 地 提出 了 
特征 提取 的 干扰 项 ,提高 了 特征 表示 的 鲁 棒 性 , SAE 提取 
特征 后 将 其 用 于 训练 神经 网 络 来 识别 异步 电机 故障 , 实 
验 表 明 , 该 方法 展现 了 基于 深度 学 习 的 故障 诊断 在 异步 
电机 故障 诊断 中 所 具有 的 独特 优势 。 陈 等 提出 了 一 种 
基于 堆栈 稀疏 自 编码 器 (SSAE) 和 softmax 分 类 器 相 结 合 
的 齿轮 故障 诊断 方法 , 通过 实验 结果 表明 ,和 文中 其 他 浅 


了 越 来 越 多 的 专家 学 者 的 关注 。 印 等 四 9 人 提出 了 提出 
PJZ SAE 和 分 簇 协议 相 结 合 的 数据 融合 算法 
SAEMDA， 该 将 同类 特征 融合 并 发 送 给 汇聚 节点 。 仿 真 
实验 表明 :和 BPFDA,SOFMDA 算法 相 比 ,SAEMDA 在 网 络 
能 耗 大 致 相当 的 情况 下 能 将 数据 融合 正确 率 提高 7.5%。 
Demethual 等 中 针对 传统 的 多 目标 方法 无 法 解决 的 具 
独特 非 线性 问题 的 原料 处 理 系统 ， 基 于 量 测 信号 进行 
故障 诊断 ,提出 了 采用 扩散 图 (DM)、 局 部 线性 嵌入 (LLE) 
和 AE 等 相 结 合 的 特征 提取 算法 ， 采 用 gustafson kessel 
fll k-medoids 算法 对 编码 信号 进行 分 类 . 结果 表明 ,此 
方法 实现 的 故障 诊断 准确 率 比 传统 方法 提高 了 909. 3K 
"9 针对 传统 故障 诊断 方法 依赖 特征 设计 和 专家 经 验 的 问 
题 ,提出 一 种 基于 改进 的 堆栈 稀 玻 自 编码 器 的 轴承 故障 
诊断 方法 , 使 用 训练 集 对 构建 的 BAS 优化 堆栈 稀疏 自 编 
码 器 (BAS-SSAE) 的 模型 进行 训练 ,并 通过 测试 集 验 证 模 
型 的 故障 诊断 分 类 能 力 ; 然 后 采用 t- 分 布 邻 域 嵌入 算法 
(t-SNE) 表 明 构 建 的 模型 能 够 对 原始 数据 进行 特征 优化 


层 学 习 模 型 相 比 ,SSAE 能 够 从 齿轮 振动 信号 中 有 效 学 习 
到 所 需 的 深层 本 质 特征 ,拥有 更 高 的 识别 准确 率 , 因 而 证 
实 了 该 方法 优越 性 。SAE 算法 还 在 机 器 人 人、 变压器 、 风 
力 发 电机 组 设备 、 核 电站 等 方面 的 故障 诊断 取得 了 非常 
不 错 的 应 用 。 

SAE 算法 由 于 良好 的 特征 提取 能 力 ， 在 故障 诊断 领 
域 一 直 被 用 与 实现 数据 的 特征 提取 和 故障 分 类 。 并 且 
SAE 器 编码 器 和 解码 器 均 具 有 良好 的 特征 提取 能 力 和 分 
类 能 力 , 因此 数据 在 经 过 SAE 算法 特征 提取 后 经 过 简单 
的 分 类 算法 就 能 得 到 不 错 的 诊断 效果 。 


1.3 卷 积 神经 网 络 在 故障 诊断 中 的 应 用 


卷 积 神经 网 络 模型 (CNN) 是 一 个 非常 经 典 的 前 馈 
神经 网 络 ， 在 图 像 处 理 上 得 到 了 非常 广泛 的 应 用 。CNN 
的 每 一 层 都 包含 多 个 卷 积 核 ， 也 叫做 滤波 器 。 通 过 这 些 
卷 积 核对 输入 信号 逐 层 卷 积 和 池 化 得 到 数据 的 抽象 表 


挖掘 出 更 具有 辨识 能 力 的 特征 ;最 后 将 BAS-SSAE 模型 与 
随机 参数 SSAE 模型 、SAE 模型 、K 最 近邻 (KNN)、 支 持 
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示 。 由 于 CNN 采用 卷 积 核 进行 前 向 传播 ， 减 小 了 模型 
的 参数 量 ， 非 常 适合 海量 数据 的 处 理 和 学 习 。 
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图 四 : 卷 积 神经 网 络 结构 


卷 积 神经 网 络 的 结构 如 图 四 所 示 ， 前 一 部 分 
卷 积 操作 和 子 采样 操作 交替 ; 


行 的 ， 后 一 部 分 的 


GER ”分 类 层 是 由 普通 的 多 层 神经 网 络 构成 。 卷 积 操作 是 通过 


卷 积 核对 原始 图 像 进行 卷 积 ， 从 而 提取 原始 信号 的 某 些 


少 网 络 的 复杂 性 ， 


特征 。 子 采样 层 是 对 卷 积 后 的 信号 进行 缩放 映射 ， 以 减 


避免 过 拟 合 的 风险 。 最 后 的 多 层 全 连 


接 神经 网 络 一 般 月 


日 于 分 类 ， 而 采用 softmax 函数 。 


CNN 算法 与 前 面 的 DBN 算法 和 SAE 算法 不 它 是 一 种 监 


督学 习 旬 


法 ， 同 时 由 了 


采用 卷 积 核对 数据 进行 处 理 ， 这 


种 方法 降低 了 网 络 复杂 性 减少 了 CNN 学 习 时 的 难度 ， 
因此 模型 的 训练 更 加 简单 CNN 的 训练 仍然 采用 梯度 下 


降 法 对 模型 参数 ; 


诊断 与 识别 中 


特征 ， 并 逐 层 组 合 抽象 生成 高 层 特 征 ,可 有 效 实 现 故 障 


行 调整 .CNN 可 提取 输入 数据 的 局 部 


张 等 w 针 对 


深度 卷 积 神经 网 络 激活 过 程 存 在 正 负 值 


计算 不 匹配 以 及 信息 流通 效率 低 导 致 的 参数 抑 余 问题 
提出 了 一 种 强化 深度 卷 积 神经 网 络 模型 。 这 种 方法 引入 


种 基于 最 大 平 


“ 滑 单 元 (Maximum Smoothing Unit; 


MSF) 函数 的 新 激活 机 


出 克 服 传统 激活 函数 的 缺点 ， 并 
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图 五 : 循环 神经 网 络 结构 图 


RNN 分 为 Jordan 型 和 Elman 型 两 种 结构 ,在 Elman 


型 RNN 中 存在 一 个 关联 层 ， 其 作 月 


是 将 前 一 个 时 刻 的 


且 引 入 注意 力 机 制 (Attention 
环 单元 (Gated recurrent unit; 


mechanism) 结合 门 控 循 
GRU) 提升 DCNN 的 信 


息 流 通 效 率 克 服 参数 元 余 问题 ， 以 综合 提升 传统 DCNN 
模型 的 故障 诊断 性 能 ,强化 深度 卷 积 神经 网 络 (EDCNN) 


的 现 有 模型 表现 出 显 着 提高 


性能， 这 在 工业 致 动 嚣 控 
制 系统 和 工业 酸性 气体 吸收 过 程 这 两 个 过 程 中 的 应 用 
得 到 了 验证 。Chen 等 提出 了 提出 了 一 种 用 于 齿轮 箱 故 


隐藏 状态 与 这 一 时 刻 的 输入 相 结 合 ， 作 为 隐 层 输入 。 
Jordan 模型 由 于 是 输出 反馈 , 包含 的 信息 较 少 因此 它 表 
示 的 动态 能 力 比 Elman 模型 较 弱 。 

当 输 入 输出 的 序列 过 长 时 , RNN 模型 不 能 很 好 保留 


障 识别 和 分 类 的 深度 学 习 算法 CNN 的 实现 。 与 同行 算 


法 相 比 ， 该 方法 在 齿轮 箱 故 障 


诊断 中 表现 出 最 佳 性 能 。 


闫 等 3 针对 部 分 齿轮 的 运行 环境 复杂 ， 导 致 采集 的 样 


本 数据 不 够 的 问题 ， 提 出 了 


种 基于 Transformer 和 卷 


积 神经 网 络 CCNN ) 的 迁移 学 习 齿 轮 故 障 诊断 方法 。 与 
其 他 不 含 Transformer 的 卷 积 神经 网 络 、 多 尺度 卷 积 神 
经 网 络 和 二 维 卷 积 神经 网 络 相 比 ，Transformer-CNN 的 


齿轮 故障 诊断 平均 准确 


99.64%。 


率 更 高 ， 其 平均 准确 率 可 达到 


基于 CNN 的 故障 诊断 方法 经 过 近 十 年 的 发 展 已 经 


术 常常 与 注意 力 机 制 相 结合 。 


了 很 大 的 突破 和 创新 。 目 前 基于 CNN 的 故障 诊断 技 


1.4 递归 神经 网 络 在 故障 诊断 中 的 应 用 


递归 神经 网 络 (RNN) 既 有 内 部 反馈 也 有 前 向 反馈 ， 
其 内 部 反馈 可 以 传递 前 项 节点 的 状态 信息 为 网 络 提供 
了 记忆 方式 ， 网 络 的 输出 不 再 仅 限 于 当前 状态 的 输入 ， 


五 所 示 


且 与 网 络 之 前 的 内 部 状态 有 关 。 RNN 网 络 的 结构 图 如 图 


与 当前 节点 较 远 出 的 信息 ， 并 且 存 在 梯度 消失 等 问题 。 
针对 这 一 问题 ， 提 出 了 RNN 的 改进 算法 长 短 时 记忆 网 
络 (LSTM)， 成 为 目前 在 故障 诊断 中 应 用 的 主要 模型 。 


LSTM 


图 六 : 长 短 时 记忆 网 络 结构 图 

长 短 时 记忆 网 络 包 含 遗 忘 门 、 记 忆 门 、 输 出 门 ， 
z f 是 ht -1 和 x 上 的 一 个 对 应 于 遗忘 门 的 整 
和 向 量 。 遗 忘 门 的 作用 是 对 神经 元 的 隐藏 态 C 上 T 
中 过 时 的 信息 进行 清理 。z i 和 z 是 记忆 门 对 应 的 
整合 向 量 ， 记 忆 门 的 作用 是 在 C 上 -1 的 隐藏 状态 中 
添加 当前 时 刻 的 状态 信息 将 C “上 -1 更 新 为 C 
z ° 是 输出 门 对 应 的 整合 向 量 ， 输 出 门 的 作用 是 结 
合 C t 得 到 模型 的 输出 y t 和 ht。 

RNN 以 及 LSTM 算法 与 DBN,，SAE, CNN 算法 的 不 
同 之 处 在 于 RNN 的 隐 含 层 之 间 的 连接 ， 使 得 网 络 能 够 


利用 样本 间 的 关联 信息 。 因 此 RNN 非常 适用 于 处 理 时 时 间 尺 度 上 讲 工业 系统 的 过 程 数 据 在 不 断 

序数 据 或 者 前 后 相关 联 的 数据 。 产生 和 储存 累积 ， 这 也 造成 了 复杂 工业 过 
Talebi 等 外 则 针对 在 非 线 性 系统 的 状态 和 传感器 程 的 海量 数据 特性 。 

均 不 确定 或 含 有 干扰 的 情况 下 ,采用 两 种 RNN 实现 了 (2) ”复杂 性 : 大 型 工业 过 程 数据 具有 很 强 的 耦 

系统 未 知 传 感 器 或 执行 器 故障 的 检测 与 隔离 ,并 将 其 应 合 行 和 非 线 性 ， 此 外 一 些 故障 早期 往往 具 

用 在 低 轨道 地 球 卫 星 上 ,大 量 仿真 实验 验证 了 该 方法 的 有 很 微弱 的 动态 响应 一 般 难 以 检测 。 还 有 

有 效 性 与 稳定 性 。Shao 等 “提出 了 用 于 化 学 过 程 故 障 一 些 故 障 是 有 多 种 因素 耦合 而 形成 ， 其 传 

诊断 的 多 通道 LSTM-CNN 方法 ， 田 纳西 州 伊 士 曼 CTE) 递 路 径 复杂 、 持 续 时 间 短 ， 常 常 难以 检测 。 

的 化 学 过 程 用 于 实验 分 析 ， 并 将 MCLSTM-CNN 模型 与 (3) PREE: 数据 的 采集 、 输 送 、 存 储 过 程 

LSTM-CNN，LSTM，CNN，RF 和 KPCA + SVM 模型 进 中 常常 混杂 有 大 量 噪声 ， 这 使 得 工业 系统 

行 了 比较 。 实 验 结果 表明 ，MCLSTM-CNN 模型 具有 较 的 故障 常常 具有 不 确定 性 。 

高 的 诊断 精度 ， 故 障 分 类 结果 优 于 其 他 模型 。 

Mahmoudp5 提 出 了 一 种 用 于 入 侵 检 测 的 机 器 学 习 方 2.2 深度 学 习 故 障 诊断 的 障碍 

ik AE-LSTM， 这 种 模型 在 检测 方法 (Dos. Probe. 

R2L. U2R. Normal) 中 取得 了 比 其 他 方法 最 高 的 (1) 在 解决 复杂 工业 系统 故障 的 过 程 中 ， 特 征 提 


准确 度 。Zheng 等 cq 提出 了 基于 堆 郑 自 编码 器 的 化 学 “” 取 和 故障 机 理 映射 起 着 重要 作用 。 故 障 机 理 是 通过 理论 
过 程 故障 诊断 新 型 无 监督 数据 挖掘 方 法 ， 该 方法 主要 或 大 量 实验 分 析 ， 得 出 了 反映 设备 故障 状态 信号 与 设备 
包括 卷 积 堆 关 自 编码 器 特征 提取 、t 分 布 式 随机 邻 域 。 ”系统 参数 之 间 关 联 映 射 规律 的 结果 。 然 而 ， 由 于 获取 完 
BA SNE) 算法 特征 可 视 化 和 聚 类 三 个 步骤， 实 。 ” 整 的 故障 数据 样本 往往 是 不 切实 际 的 ， 因 此 如 何 将 深度 
验 结果 说 明了 数据 挖掘 方法 的 有 效 性 。 学 习 与 现 有 的 故障 机 理 相 结 合 ， 解 决 复杂 工业 系统 故障 
递归 神经 网 络 由 于 能 利用 输入 样本 间 的 信息 ， 因 此 。 ”中 存在 的 “相关 性 ”问题 ， 以 实现 有 效 的 系统 运行 状态 

在 预测 方面 具有 不 可 比拟 的 优势 ， 在 如 今 的 大 模型 时 代 ”特征 提取 ， 仍 然 是 一 个 具有 挑战 性 的 问题 ， 并 且 目 前 还 
RNN 在 深度 学 习 中 受到 越 来 越 多 的 重视 , 它 在 工业 过 程 ”没有 明显 的 突破 性 进展 rs。 
的 故障 诊断 中 建 辉 发 挥 越 来 越 重要 的 作用 。 (2) 复杂 性 故障 诊断 ,故障 诊断 方法 研究 中 提出 
了 许多 有 效 的 “ 望 闻 问 测 ， 诊 断 手段 但 针对 早期 故障 、 

M HF h C "VER xerm —— 微弱 故障 、 复 合 故 障 、 系 统 故障 等 的 诊断 方法 还 存在 不 

2. 深度 学 习 在 故障 诊断 应 用 的 障碍 足 可靠 的 诊断 方法 有 限 系统 运行 过 程 中 不 可 避免 地 产 
如 今 随 着 工业 对 象 的 大 型 化 、 复 杂 化 ， 通 过 机 理 分 “，” 生 损 伤 和 出 现 早期 故障 其 具有 潜在 性 和 动态 响应 微弱 

析 获 取 监 测 对 象 准确 的 、 完 备 的 故障 知识 已 经 变 得 越 来 ”性 ,复合 故障 和 系统 故障 由 于 多 因素 耦合 和 传递 路 径 复 
越 困难 。 基 于 深度 学 习 的 故障 诊断 技术 通过 建立 深层 的 。” 杂 往往 导致 单一 信号 处 理 方法 难以 有 效 溯源 故障 成 因 
神经 网 络 ， 模 拟人 脑 的 工作 原理 对 大 量 的 过 程 数 据 进行 。 ”而 目前 针对 此 复杂 性 故障 有 效 的 解决 方案 就 是 增加 传 
学 习 、 理 解 、 分 析 ， 并 根据 输入 数据 对 网 络 权重 进行 调 。” 感 器 力求 通过 增加 监测 手段 实现 该 类 复杂 性 故障 的 检 


整 ， 最 终 使 网 络 能 够 获得 解读 过 程 数 据 故 障 信息 的 能 力 。 5i. 
因此 基于 深度 学 习 的 故障 诊断 的 关键 在 于 能 否 彻底 提 (3) 工 业 故 障 诊断 中 的 小 样本 问题 . 海量 的 正常 运 
取 过 程 数据 的 知识 信息 。 行 数据 与 小 样本 的 故障 状态 数据 是 工业 大 数据 的 一 个 
典型 特点 ,而 深度 学 习 又 需要 大 量 的 样本 进行 训练 ,二 
2.1 大 型 复杂 工业 过 程 的 特性 者 之 间 的 矛盾 似乎 不 可 调和 。 ,如 何 设计 出 一 个 适用 于 多 
源 输入 数 据 ,同时 具有 较 好 功能 的 特征 提取 模型 来 解决 
大 型 的 工业 系统 由 于 其 功能 单元 很 多 ， 而 且 每 


每 一 个 ERT 业 系统 “大 数据 ”难题 ,实现 复杂 工业 系统 故障 
功能 单元 都 与 其 他 单元 有 着 复杂 的 内 部 联系 ， 使 得 了 


PA 


[ 业 诊断 也 是 其 中 的 一 个 挑战 。 


系统 呈现 出 特定 的 特性 。 (4) 深度 学 习 的 可 解释 性 问题 .深度 学 习 因为 是 一 
(1) ”海量 数据 特性 ， 随 着 传 感 技术 和 存储 技术 。 种 黑箱 模型 ， 其 在 进行 故障 诊断 时 可 解释 性 往往 很 差 ， 
的 发 展 ， 大 型 工业 系统 都 配备 了 大 量 的 传 。 ”其 泛 化 能 力 备 受 质疑 。 如 何 有 效 的 解决 基于 深度 学 习 的 

感 器 ， 在 空间 尺度 上 拓展 了 数据 量 值 。 从 。 ”故障 诊断 的 解释 性 问题 时 面临 的 一 大 挑战 。 


(5) 训练 样本 多 源 不 统一 .虽然 工业 过 程 产 生 了 海 
量 的 数据 ， 其 中 大 量 的 数据 由 于 分 布 不 同 ， 不 同 源 但 相 
似 数 据 间 的 信息 不 能 被 有 效 融 合 利 用 。 如 何 构 建 深度 学 
习 方 法 诬 以 适应 协调 多 源 数据 ， 也 是 一 个 很 大 的 挑战 。 


3. 结 论 


本 篇 文章 针对 深度 学 习 在 故障 诊断 中 的 应 用 做 出 
了 简要 的 介绍 。 首 先 介 绍 了 DBN、SAE、CNN、RNN JL 
种 相关 深度 学 习 算 法 的 原理 和 近 几 年 国内 外 的 一 些 改 
进 算法 相关 研究 。 最 后 简要 介绍 了 大 型 复杂 工业 系统 的 
特性 ， 目 前 一 些 存在 的 挑战 和 未 来 研究 的 方向 。 
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